智能论文笔记

KNIFE: Knowledge Distillation with Free-Text Rationales

Aaron Chan , Zhiyuan Zeng , Wyatt Lake , Brihi Joshi , Hanjie Chen , Xiang Ren

分类：自然语言处理 | 人工智能 | 机器学习

2022-12-19

Free-text rationales (FTRs) follow how humans communicate by explaining reasoning processes via natural language. A number of recent works have studied how to improve language model (LM) generalization by using FTRs to teach LMs the correct reasoning processes behind correct task outputs. These prior works aim to learn from FTRs by appending them to the LM input or target output, but this may introduce an input distribution shift or conflict with the task objective, respectively. We propose KNIFE, which distills FTR knowledge from an FTR-augmented teacher LM (takes both task input and FTR) to a student LM (takes only task input), which is used for inference. Crucially, the teacher LM's forward computation has a bottleneck stage in which all of its FTR states are masked out, which pushes knowledge from the FTR states into the task input/output states. Then, FTR knowledge is distilled to the student LM by training its task input/output states to align with the teacher LM's. On two question answering datasets, we show that KNIFE significantly outperforms existing FTR learning methods, in both fully-supervised and low-resource settings.

translated by 谷歌翻译

Deep Lake: a Lakehouse for Deep Learning

Sasun Hambardzumyan , Abhinav Tuli , Levon Ghukasyan , Fariz Rahman , Hrant Topchyan , David Isayan , Mikayel Harutyunyan , Tatevik Hakobyan , Ivo Stranic , Davit Buniatyan

分类：人工智能 | 计算机视觉

2022-09-22

传统的数据湖泊通过启用时间旅行，运行SQL查询，使用酸性交易摄入数据以及可视化PBABYTE尺度数据集在云存储中，为分析工作负载提供了关键的数据基础架构。它们使组织能够分解数据孤岛，解锁数据驱动的决策，提高运营效率并降低成本。但是，随着深度学习接管常见的分析工作流程，传统数据湖泊对诸如自然语言处理（NLP），音频处理，计算机视觉和涉及非尾巴数据集的应用程序的有用程度降低。本文介绍了Deep Lake，这是一个开源湖泊，用于在Activeloop开发的深度学习应用程序。 Deep Lake保持了一项关键区别的香草数据湖的好处：它以张量的形式存储复杂数据，例如图像，视频，注释以及表格数据，并将数据迅速流式传输到网络上（a ）张量查询语言，（b）浏览器可视化引擎或（c）不牺牲GPU利用率的深度学习框架。可以从Pytorch，Tensorflow，Jax，与许多MLOPS工具集成在一起的数据集。

translated by 谷歌翻译

Robust Locomotion on Legged Robots through Planning on Motion Primitive Graphs

Wyatt Ubellacker , Aaron Ames

分类：机器人

2022-09-15

机器人系统的功能需求通常需要在干扰或不确定环境的影响下完成各种任务或行为。越来越多的兴趣是动态机器人的自主权，例如多电动器，汽车和腿部平台。在这里，干扰和环境条件可能会对单个动态行为的成功表现产生重大影响，称为“运动原始人”。尽管如此，通过合适的运动原语切换和过渡可以实现鲁棒性。本文通过提出运动原始动力学的抽象和相应的“运动原始传递函数”来贡献这种方法。由此，构建了混合的离散和连续的“运动原始图”，并详细介绍了能够在线搜索该图的算法。结果是一个能够实现动态系统的整体鲁棒性的框架。这是针对四足动物机器人的一组运动原语的实验证明的，受到各种环境和故意干扰。

translated by 谷歌翻译

Visualizing the Passage of Time with Video Temporal Pyramids

Melissa E. Swift , Wyatt Ayers , Sophie Pallanck , Scott Wehrwein

分类：计算机视觉

2022-08-25

我们可以通过观看数月或数年来了解一个场景？在长时间播放中录制的视频将在多个时间范围内描绘有趣的现象，但识别和观看它们带来了挑战。该视频太长了，无法完整观看，并且某些事件的实时体验太慢，例如冰川静修。及时视频是总结长视频和可视化慢时尺度的常见方法。但是，时间段仅限于单个选择的时间频率，并且由于框架之间的混叠和时间不连续性，通常会出现闪烁。在本文中，我们提出了视频时间金字塔，该技术可以解决这些局限性并扩大可视化时间流逝的可能性。受到计算机视觉的空间图像金字塔的启发，我们开发了一种在时间域中构建视频金字塔的算法。视频时间金字塔的每个级别都可以看到不同的时间表。例如，每月时间表的视频通常非常适合可视化季节性变化，而一分钟时间尺度的视频最适合可视化日出或云层在天空中的运动。为了帮助探索不同的金字塔水平，我们还提出了一个视频频谱图，以可视化整个金字塔的活动量，从而提供了场景动力学的整体概述，并能够在时间和时间表上探索和发现现象。为了展示我们的方法，我们已经从十个户外场景中构建了视频时间金字塔，每个户外场景都包含数月或数年的数据。我们将视频颞金字塔层与天真的时间解体进行了比较，并发现我们的金字塔可以无视长期变化的别名观看。我们还证明，视频谱图通过实现概述和以细节为中心的观点来促进跨金字塔水平的现象的探索和发现。

translated by 谷歌翻译

HTML版本

Shadows Aren't So Dangerous After All: A Fast and Robust Defense Against Shadow-Based Adversarial Attacks

Andrew Wang , Wyatt Mayor , Ryan Smith , Gopal Nookula , Gregory Ditzler

分类：计算机视觉

2022-08-18

在自动驾驶符号识别等任务中，强大的分类至关重要，因为错误分类的弊端可能是严重的。对抗性攻击威胁着神经网络分类器的鲁棒性，导致它们始终如一，自信地误导了道路标志。一种这样的攻击，基于阴影的攻击，通过应用自然的阴影来输入图像引起误解，从而导致人类观察者看起来很自然，但对这些分类器感到困惑。当前针对此类攻击的防御能力采用简单的对抗训练程序，分别在GTSRB和LISA测试集上获得相当低的25 \％和40 \％的鲁棒性。在本文中，我们提出了一种健壮，快速且可推广的方法，旨在在道路标志识别的背景下防御阴影攻击，以增强具有二进制自适应阈值和边缘图的源图像。我们从经验上表明了它针对影子攻击的稳健性，并重新制定了该问题，以表明其相似性$ \ varepsilon $基于扰动的攻击。实验结果表明，我们的边缘防御能力达到78 \％的鲁棒性，同时在GTSRB测试集上保持98 \％的良性测试精度，这是我们阈值防御的类似结果。链接到我们的代码是在论文中。

translated by 谷歌翻译

An Exploration of How Training Set Composition Bias in Machine Learning Affects Identifying Rare Objects

Sean E. Lake , Chao-Wei Tsai

分类：机器学习

2022-07-07

当训练机器学习分类器上的一个类本质上很少见的数据时，分类器通常会为稀有班级分配太少的来源。为了解决这个问题，通常是重量重量罕见类的示例以确保不忽略它。由于相同的原因，训练源类型平衡更接近的限制数据也是一种经常的做法。在这里，我们表明这些实践可以将模型偏向于过度分配稀有阶级的资源。我们还探讨了如何检测训练数据偏见何时对训练的模型的预测以及如何减少偏见的影响产生统计学上的显着影响。尽管此处开发的技术的影响的大小会随应用程序的细节而变化，但在大多数情况下，它应该适度。但是，它们普遍适用于每次使用机器学习分类模型，使其类似于Bessel对样本方差的校正。

translated by 谷歌翻译

Test and Evaluation of Quadrupedal Walking Gaits through Sim2Real Gap Quantification

Prithvi Akella , Wyatt Ubellacker , Aaron D. Ames

分类：机器学习 | 机器人

2022-01-04

在这封信中，作者提出了一种两步的方法来评估和验证真正的系统，以满足其运作目标的能力。具体而言，每当系统目标具有可量化的满意度量时，即信号时间逻辑规范，屏障函数等 - 作者通过详细说明的贝叶斯优化程序，制定了两个单独的优化问题。这种双向方法具有量化系统模拟器与其硬件对应物之间的SIM2重组的增加的益处。我们的贡献是双重的。首先，我们在解决这些优化问题时表现出了我们概述的优化过程的可重复性。其次，我们表明相同的过程可以通过识别在不同环境中运行的模拟器和其硬件对应物之间的SIM2重差来区分不同环境之间。

translated by 谷歌翻译

Novelty-based Generalization Evaluation for Traffic Light Detection

Arvind Kumar Shekar , Laureen Lake , Liang Gou , Liu Ren

分类：计算机视觉 | 机器学习

2022-01-03

卷积神经网络（CNNS）的出现导致了它们在若干域中的应用。一个值得注意的应用是自主驱动的感知系统，它依赖于来自CNN的预测。从业者通过在独立的测试数据集上计算各种指标来评估此类CNN的泛化能力。通常基于一个前提条件，即其元素不是培训数据的一部分来选择测试数据集。这样的数据集可能包含既具有相似和新颖的w.r.t的对象。训练数据集。尽管如此，现有的作品不会估计测试样品的新颖性，并同样对其进行评估以进行评估。这种新颖性的基于基于的评估具有重要性，以验证自主驾驶应用中CNN中的CNN的适应性。因此，我们提出了一种CNN泛化评分框架，其考虑了测试数据集中的对象的新颖性。我们从表示学习技术开始将图像数据减少到低维空间中。在这个空间上，我们估计了测试样本的新颖性。最后，我们计算概括得分作为测试数据预测性能和新颖性的组合。我们对我们的交通灯检测应用进行了一个实验研究。此外，我们系统地可视化了一种可解释的新奇概念的结果。

translated by 谷歌翻译

Safety-Aware Preference-Based Learning for Safety-Critical Control

Ryan K. Cosner , Maegan Tucker , Andrew J. Taylor , Kejun Li , Tamás G. Molnár , Wyatt Ubellacker , Anil Alan , Gábor Orosz , Yisong Yue , Aaron D. Ames

分类：机器人

2021-12-15

将动态机器人带入野外，需要平衡性能和安全之间。然而，旨在提供强大安全保证的控制器通常会导致保守行为，并调整这些控制器，以找到性能和安全之间的理想权衡通常需要域专业知识或仔细构造的奖励功能。这项工作提出了一种设计范式，用于系统地实现平衡性能和强大安全性的行为，通过将基于安全感知的基于偏好（PBL）与控制屏障功能（CBF）集成来实现平衡性能和鲁棒安全性。融合这些概念 - 安全感知的学习和安全关键控制 - 提供了一种在实践中实现复杂机器人系统的安全行为的强大手段。我们展示了这种设计范式的能力，以实现在硬件上的模拟和实验上的四足机器人的安全和表演感知的自主操作。

translated by 谷歌翻译

Emotion-Cause Pair Extraction in Customer Reviews

Arpit Mittal , Jeel Tejaskumar Vaishnav , Aishwarya Kaliki , Nathan Johns , Wyatt Pease

分类：自然语言处理 | 人工智能

2021-12-07

由于其在各个领域的重要性和潜在应用，情感 - 原因对提取（ECPE）是一种自然语言处理的复杂而流行的地区。在本报告中，我们的目标是在线评论领域的ECPE中展示我们的ECPE工作。通过手动注释的数据集，我们探索使用神经网络提取情绪原因对的算法。此外，我们提出了一种使用先前参考资料的模型，并将情感导致对与情感感知的单词嵌入领域的研究相结合，在那里我们将这些嵌入的嵌入式发送到Bi-LSTM层中，这为我们提供了情绪相关的条款。随着有限数据集的约束，我们实现了。我们报告的总体范围包括全面的文献审查，通过提出对管道的改进以及特定域的算法开发和实施来修改ECPE的引用方法的全面文献审查，以及修改以前的工作评论评论。

translated by 谷歌翻译